Podemos utilizar las herramientas de minería de texto para analizar el contenido emocional del texto mediante programación
En el análisis de sentimiento se suelen distinguir dos grandes enfoques:
Una forma de analizar el sentimiento de un texto es considerarlo como una combinación de sus palabras individuales y el contenido sentimental del texto completo como la suma del contenido sentimental de cada palabra. Se analiza el texto buscando qué palabras están en ese diccionario y se calcula un promedio de sentimiento
✅ Ventajas: fácil de interpretar, rápido, transparente.
❌ Desventajas: no capta contexto, ironía, negaciones o intensificadores (ej: “no está nada mal”).
Este segundo método usa técnicas de aprendizaje automático: se entrena un modelo con textos previamente clasificados por humanos (como “positivo”, “negativo”, “neutral”) para que aprenda patrones de lenguaje que predicen el sentimiento, incluso cuando no aparecen palabras explícitamente “positivas” o “negativas”.
✅ Ventajas: capta contexto, negaciones, matices.
❌ Desventajas: requiere muchos datos, mayor complejidad técnica y computacional.
El paquete tidytext proporciona acceso a varios léxicos de sentimiento
AFINNde Finn Årup Nielsen ,
bingde Bing Liu y colaboradores , y
nrcde Saif Mohammad y Peter Turney .
Estos tres léxicos se basan en unigramas, es decir, palabras individuales. Contienen muchas palabras en inglés y se les asigna una puntuación según su sentimiento positivo o negativo, y también, posiblemente, emociones como alegría, ira, tristeza, etc
La mayoría de los modelos y paquetes de análisis de sentimiento están entrenados en inglés.
👉 Por eso, en esta clase:
Dataset de German Rosati obtenido a través de scrapeo web